Implementierung von IR-Modellen auf Basis spaltenorientierter Datenbanken oder invertierter Listen
نویسندگان
چکیده
Im Information Retrieval (IR) wird die Anwendung spaltenorientierter Datenbankmanagementsysteme (DBMS) diskutiert, um u.a. durch die Trennung von Datenhaltung und Suchlogik zusätzliche Flexibilität zu gewinnen. Es stellt sich die Frage, ob sich solche Systeme für den praktischen Einsatz eignen, oder ob deren Einsatz auf das Prototyping beschränkt ist. Ziel dieser Arbeit ist es daher, IR-Systeme auf Basis spaltenorientierter DBMS mit konventionellen IR-Bibliotheken auf Basis invertierter Listen bzgl. ihrer Effektivität und Effizienz unter Verwendung des weit verbreiteten Okapi BM25 Retrieval-Modells zu vergleichen. Dabei werden bisherige Arbeiten insbesondere im Hinblick auf die Anzahl und den Typ der untersuchten Anfragen sowie die durchgängige Verwendung von Kompressionsmöglichkeiten erweitert.
منابع مشابه
KeyX: ein selektiver schlüsselorientierter Index für das Index Selection Problem in XDBMS
Zusammenfassung In relationalen Datenbank-Management-Systemem (RDBMS) werden Indizes verwendet, um spezifische und häufig wiederkehrende Anfragen zu beschleunigen. Die Auswahl von passenden Indizes ist ein wichtiger Prozess beim Anlegen und Optimieren der Datenbank, der meist von einem Administrator oder einem Index-Auswahl-Tool durchgeführt wird, welches eine Menge von passenden Indizes vorsch...
متن کاملTelling TestStories - Modellbasiertes Akzeptanz-Testen Serviceorientierter Systeme
Moderne Serviceorientierte Systeme werden immer komplexer, was hohe Anforderungen an ihre Qualitätssicherung stellt. Die Qualitätssicherung Serviceorientierter Systeme weist allerdings eine Reihe von Spezifika auf wie die Einbindung externer Peers, deren innere Struktur man nicht kennt, die durch die heute verfügbaren Testmethoden und Testframeworks nicht abgedeckt sind. Telling TestStories, ku...
متن کاملEin merkmalsorientierter Speichermanager für eingebettete Systeme
Der Bereich der eingebetteten Systeme ist ein bedeutender Markt. Einsatzgebiete sind beispielsweise Autosteuerungen oder Sensornetzwerke. Häufig benötigen derartig eingebettete Rechnersysteme Infrastruktursoftware zur Datenhaltung. Auf Grund der Heterogenität der Hardund Software, sowie der extremen Ressourcenbeschränkungen, ist eine Adaption der klassischen Mehrzwecksysteme aus Großrechnern od...
متن کاملDifferenzanalyse und Vereinigung von Modellen auf der Basis ihrer Metamodelle
Die modellgetriebene Softwareentwicklung im Team erfordert entsprechende Technologien zur Analyse von Modelldifferenzen sowie zur Vereinigung verschiedener Modelle. Dieser Artikel stellt die in diesem Kontext von der ikv++ technologies ag entwickelten Konzepte und Lösungen vor. Teamwork und modellgetriebene Softwareentwicklung Modellgetriebene Softwareentwicklungstechnologien vereinfachen und v...
متن کاملModellbasierte Oberflächen für Abnahmetests
Die Durchführung von Tests ist eine Voraussetzung zur Erstellung qualitativ hochwertiger, nicht trivialer Softwaresysteme. Das modellgetriebene Testen ermöglicht eine hohe Testabdeckung bei gleichzeitiger Abstraktion von der zu testenden Implementierung, was insbesondere beim Testen innerhalb von Produktfamilien von Vorteil ist. Als Alternative zur vollständigen Generierung von Testmodellen ste...
متن کامل